We present a data-driven framework to automate the vectorization and machine interpretation of 2D engineering part drawings. In industrial settings, most manufacturing engineers still rely on manual reads to identify the topological and manufacturing requirements from drawings submitted by designers. The interpretation process is laborious and time-consuming, which severely inhibits the efficiency of part quotation and manufacturing tasks. While recent advances in image-based computer vision methods have demonstrated great potential in interpreting natural images through semantic segmentation approaches, the application of such methods in parsing engineering technical drawings into semantically accurate components remains a significant challenge. The severe pixel sparsity in engineering drawings also restricts the effective featurization of image-based data-driven methods. To overcome these challenges, we propose a deep learning based framework that predicts the semantic type of each vectorized component. Taking a raster image as input, we vectorize all components through thinning, stroke tracing, and cubic bezier fitting. Then a graph of such components is generated based on the connectivity between the components. Finally, a graph convolutional neural network is trained on this graph data to identify the semantic type of each component. We test our framework in the context of semantic segmentation of text, dimension and, contour components in engineering drawings. Results show that our method yields the best performance compared to recent image, and graph-based segmentation methods.
translated by 谷歌翻译
人级AI将对人类社会产生重大影响。但是,实现时间的估计值应有争议。为了到达人工通用情报(AGI)的人工AI,而不是专门从事特定任务的AI系统,是技术意义上有意义的长期目标。但是现在,由于深度学习的进步,这一成就越来越近了。考虑到最近的技术发展,通过“综合技术地图方法”讨论人级AI的完成日期是有意义的,其中我们以合理的粒度绘制人类水平的能力,确定当前的技术范围,并讨论并讨论人类水平的能力。穿越未开发领域的技术挑战,并预测何时将克服它们。本文提出了一种新的论证选择来查看本体论六重奏,该选项涵盖了实体,该实体与我们的日常直觉和科学实践一致,作为全面的技术图。因为关于如何解释世界的大多数建模,因此智能主题是对远端实体的认可以及对它们的时间进化的预测,能够处理所有远端实体是一个合理的目标。根据哲学和工程认知技术的发现,我们预测,在相对较远的将来,AI将能够与人类相同的程度识别各种实体。
translated by 谷歌翻译
人的大脑在其几种功能中分析了口语中的双重发音结构,即双重关节分析(DAA)。单词连接到形成句子和单词由音素或音节组成的层次结构称为双关节结构。尽管已经获得了一些见解,但尚未建立在人脑中DAA的何处以及如何进行DAA。此外,基于概率生成模型(PGM)的现有计算模型不融合神经科学的发现,并且以前尚未讨论过其与大脑的一致性。这项研究将这些现有的计算模型与神经科学的发现进行了比较,映射和整合,以弥合这一差距,并且发现与未来的应用和进一步的研究有关。这项研究提出了一个DAA假设的PGM,该假设可以根据几种神经科学调查的结果在大脑中实现。该研究涉及(i)研究和组织与口语处理有关的解剖结构,以及(ii)与感兴趣区域的解剖结构和功能相匹配的PGM。因此,这项研究提供了新的见解,这些见解将是基础,以进一步探索大脑中的DAA。
translated by 谷歌翻译
哪些目标标签对于图形神经网络(GNN)培训最有效?在某些应用GNNS Excel样药物设计或欺诈检测的应用中,标记新实例很昂贵。我们开发一个具有数据效率的主动采样框架,即ScatterSample,以在主动学习设置下训练GNN。 ScatterSample采用称为不同确定性的抽样模块,从样品空间的不同区域收集具有较大不确定性的实例以进行标记。为了确保所选节点的多样化,不同的确定性簇群簇较高的不确定性节点,​​并从每个群集中选择代表性节点。严格的理论分析表明,与标准的主动采样方法相比,我们的ScatterSample算法进一步支持了其优势,该方法旨在简单地简单地提高不确定性,而不是使样品多样化。特别是,我们表明ScatterSample能够在整个样品空间上有效地减少模型不确定性。我们在五个数据集上的实验表明,散点样本明显优于其他GNN主动学习基线,特别是它将采样成本降低了50%,同时达到了相同的测试准确性。
translated by 谷歌翻译
知识图形问题应答(kgqa)涉及使用自然语言查询从知识图(kg)中检索事实。 KG是由关系相关的实体组成的策划事实集。某些事实还包括形成时间kg(tkg)的时间信息。虽然许多自然问题涉及显式或隐含的时间限制,但TKGS上的问题应答(QA)是一个相对未开发的地区。现有解决方案主要是为简单的时间问题设计,可以通过单个TKG事实直接回答。本文提出了一种全面的嵌入式框架,用于回答TKGS的复杂问题。我们的方法被称为时间问题推理(TempoQR)利用TKG Embeddings将问题与其指的特定实体和时间范围进行地面。它通过使用三个专用模块增强与上下文,实体和时空信息的问题嵌入问题。第一个计算给定问题的文本表示,第二个将其与所涉及的实体的实体嵌入物组合,第三个生成特定于特定于问题的时间嵌入。最后,基于变换器的编码器学习用问题表示来融合生成的时间信息,该问题表示用于答案预测。广泛的实验表明,TempoQR在最先进的方法上通过25-45个百分点提高了25--45个百分点,并且它将更好地概括到未经说明的问题类型。
translated by 谷歌翻译
建立一种人类综合人工认知系统,即人工综合情报(AGI),是人工智能(AI)领域的圣杯。此外,实现人工系统实现认知发展的计算模型将是脑和认知科学的优秀参考。本文介绍了一种通过集成元素认知模块来开发认知架构的方法,以实现整个模块的训练。这种方法是基于两个想法:(1)脑激发AI,学习人类脑建筑以构建人类级智能,(2)概率的生成模型(PGM)基础的认知系统,为发展机器人开发认知系统通过整合PGM。发展框架称为全大脑PGM(WB-PGM),其根本地不同于现有的认知架构,因为它可以通过基于感官电机信息的系统不断学习。在这项研究中,我们描述了WB-PGM的基本原理,基于PGM的元素认知模块的当前状态,与人类大脑的关系,对认知模块的整合的方法,以及未来的挑战。我们的研究结果可以作为大脑研究的参考。随着PGMS描述变量之间的明确信息关系,本说明书提供了从计算科学到脑科学的可解释指导。通过提供此类信息,神经科学的研究人员可以向AI和机器人提供的研究人员提供反馈,以及目前模型缺乏对大脑的影响。此外,它可以促进神经认知科学的研究人员以及AI和机器人的合作。
translated by 谷歌翻译
我们解决了弥合海马形成(HPF)神经科学知识与机器人和人工智能的工程知识之间差距的具有挑战性的。同时定位和映射(SLAM)已经在机器人学中实现为空间认知的基本功能。在这项研究中,我们的目标是调查Slam功能如何对应于HPF。为此,提出了一种基于文献综述的假设,并且呈现了其验证的方向,而不执行任何新的模拟。我们调查了HPF模型和各种计算的模型,包括脑激发的血液,空间概念形成和深度生成模型。此外,我们讨论了神经科学中HPF的结果与机器人中的SLAM之间的关系。由此,使用用于构建脑参考架构的方法来构建海马形成启动的概率产生模型(PGM)。我们基于传统SLAM模型的修改提出了一种HPF-PGM作为计算模型,该模型设计成与HPF的解剖结构和功能高度一致。通过参考大脑,我们建议将Enocentric / Allocentric信息集成从Entorlinal Cortex集成到海马以及使用离散事件队列的使用。
translated by 谷歌翻译